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Jj] E: 雾 天 是 影响 高 速 公路 交通 安全 的 重要 因素 。 研 究 从 监控 图 像 进行 高 速 公路 雾 天 能 见 度 的 自动 识别 方法 可 以 
为 交通 管理 部 门 的 智能 管理 和 决策 提供 技术 支持 。 根 据 大 气 散 射 模型 分 析出 与 雾 浓度 相关 的 多 个 物理 因素 ， 提 出 了 
综合 该 些 物理 因素 的 多 通路 融合 识别 网 络 。 该 网 络 使 用 三 个 通路 联合 学 习 深 度 视觉 特征 、 传 输 矩 阵 特 征 和 场景 深度 
特征 ， 并 设计 注意 力 融 合 模 块 来 自 适 应 地 融合 这 三 类 特征 以 进行 能 见 度 等 级 识别 。 同 时 构建 了 一 个 合成 数据 集 和 一 
个 真实 的 高 速 公 路 场景 数据 集 ， 用 于 网 络 参 数学 习 和 性 能 评估 。 实 景 数据 集中 的 图 像 是 从 中 国 多 条 高 速 公路 的 监控 
os DIESE dene diae tes, 所 提出 的 方法 可 以 适应 不 同 的 监控 拍摄 场景 ， 能 够 比 现 有 方法 更 准 
确 地 识别 能 见 度 等 级 ， 有 效 提 升 了 识别 精度 。 
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Recognition of highway visibility level in foggy weather using multi-stream deep fusion network 
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Atmospheric Environment & Equipment Technology, Nanjing 210044, China; 2. Jiangsu Meteorological Service Center, 
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Abstract: Foggy weather is an important factor affecting highway traffic safety. Research on the automatic recognition 
method of highway fog visibility from surveillance images can provide technical support for the intelligent management and 
decision-making of the traffic management department. This paper analyzes multiple physical factors related to fog density 
based on the atmospheric scattering model and proposes a multi-channel fusion network that integrates these physical factors. 
Specifically, the method jointly exploits three streams to learn deep visual feature, transmission matrix feature and scene depth 
feature, and designs an attention fusion module to adaptively fuse these three streams for the final visibility level recognition, 
which is very beneficial for improving the recognition accuracy. Meanwhile, this paper constructs a synthetic dataset and a 


real-scene dataset for network parameters learning and performance evaluation. The images in the real-scene dataset are 


collected from surveillance videos of multiple highways in China. Experiments on these two datasets show that this method 
can identify visibility level more accurately than existing methods. 
Key words: visibility level recognition; multi-stream network; atmospheric scattering model; attention fusion 


0 az 助 系统 的 失效 ， 因 此 这 些 基 于 视觉 的 自动 驾驶 系统 也 需要 能 
m 见 度 识 别 ， 从 而 可 以 及 时 调整 操作 或 对 鸭 驶 员 作 出 提醒 口 。 

雾 是 自然 环境 中 常见 的 天 气 现 象 ， 雾 天 条 件 下 光线 被 空 前 广泛 应 用 的 能 见 度 识别 方法 主要 包括 人 眼 观测 和 仪 

气 中 的 悬浮 颗粒 吸收 和 散射 ， 导 至 EE 见 度 距离 降低 。 这 会 对 ”器 测量 。 人 有 眼 观 测 是 一 种 主观 的 估计 方法 ， 不 仅 耗 费 人 力 而 
现实 生活 的 诸多 方面 造成 潜在 的 安全 隐患， 尤其 是 在 公路 运 。” 且 存 在 较 大 误差 。 仪 器 测量 主要 是 通过 放置 在 室外 的 能 见 度 
输 中 , 能见度 的 降低 会 大 大 增加 交通 事故 的 发 生 率 。 据 统计 ， 传感器 来 测量 能 见 度 距离 。 虽 然 仪器 测量 提高 了 识别 精度 ， 
影响 道路 正常 运行 的 恶劣 天 气 中 大 雾 为 主要 影响 天 气 ， 占 比 ”但 仪器 部 署 成 本 高 ， 识 别 范围 非常 有 限 ， 难 以 实现 大 规模 覆 


达 69%。 雾 天 时 ， 发 生 交通 事故 的 概率 会 比 畏 天 时 高 出 几 盖 。 目 前 的 高 速 公路 通常 都 配备 了 良好 的 监控 系统 。 图 1 显 


赂 。 党 中 央 高 度 重视 交通 安全 问题 ， 各 级 部 门 多 次 提出 相关 ，” 示 了 大 雾 天 气 下 不 同 能 见 度 范围 的 高 速 公 路 监控 图 像 。 
指导 意见 和 规划 纲要 。 国 务 院 关 于 加 强 道路 交通 安全 工作 的 ”根据 不 同 雾 浓 度 下 监控 图 像 的 差异 性 ， 可 以 利用 计算 机 
意见 》 中 也 指出 ， 要 加 强 道路 交通 安全 设施 建设 ， 积 极 推进 ”视觉 和 深度 学 习 方 法 , 建立 一 种 成 本 低 、 灵 活性 高 的 自动 


高 速 公 路 灾害 性 天 气 预报 和 预警 系统 建设 ， 提 高 对 浓 筋 等 恶 ”识别 模型 。 
劣 天 气 的 防范 应 对 能 力 。 因 此 人 迫 切 需要 建立 高 速 公路 筋 天 能 为 了 提升 识别 算法 的 适应 性 ， 本 文 着 重 研 究 仅 使 用 单 张 
见 度 自动 识别 系统 ， 这 样 高 速 公路 管理 部 门 能 够 获得 准确 和 高 速 公路 筋 天 图 像 的 能 见 度 等 级 识别 方法 。 但 由 于 监控 摄像 
即时 的 决策 支持 ， 进 而 采取 相应 的 控制 措施 ， 对 降低 事故 率 ”的 视角 和 光照 条 件 的 不 同 ， 准 确 识别 不 同 场景 下 雾 天 图 像 的 
很 大 帮助 串 。 此 外 ， 由 于 能 见 度 下 降 会 导致 自动 驾驶 辅 。 能 见 度 等 级 是 一 项 具有 挑战 性 的 任务 。 现 有 的 研究 大 多 集中 
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在 图 像 去 雾 算法 E-4 上， 然而 它们 是 两 个 不 同 的 任务 。 图 像 去 
秀 是 一 种 通过 调整 每 个 像素 的 值 来 提高 图 像 质量 的 图 像 增强 


任务 ， 能 见 度 识别 则 是 通过 分 析 图 像 的 雾 分 布 来 推断 能 见 度 


水 平 。 目 前 ， 与 图 像 去 雾 算法 相 比 ， 从 雾 天 图 像 中 识别 能 见 


度 的 工作 较 少 ， 大 致 可 以 分 为 两 类 : 基于 物理 模型 的 方法 和 


基于 深度 学 习 的 方法 。 基 于 物理 模型 的 方法 主要 是 基于 大 气 


散射 模型 ， 它 首先 估计 大 气 散 射 模 型 中 的 场景 深度 参数 和 传 
输 矩 阵 参 数 ， 然 后 根据 一 些 启发 式 规则 来 估计 能 见 度 。 虽 然 


这 种 方法 有 较 好 的 物理 解释 


性 


， 但 并 不 能 很 好 地 适应 高 速 公 


路 的 实际 复杂 场景 。 基 于 深度 学 习 的 方法 主要 利用 卷 积 神经 


网 络 优秀 的 学 习 能 力 ， 直 接 学 习 从 雾 天 图 像 到 能 见 度 水 平 的 
函数 映射 。 但 由 于 监控 摄像 机 视角 和 光照 条 件 等 因素 ， 视 觉 


特征 会 有 显著 差异 ， 进 而 影响 识别 的 准确 性 。 


图 1 不 同 筋 浓 度 下 高 速 公路 监控 图 像 


Fig.1 Some highway surveillance images under different foggy densities 


为 了 应 对 上 述 问 题 ， 本 文 根 据 雾 形成 的 物理 模型 ， 提 出 
了 高 速 公 路 雾 天 图 像 能 见 度 识别 的 多 通路 深度 融合 网 络 模型 ， 


称 为 MSVP-Net。 该 方法 融合 了 传输 矩阵 特征 、 场 景深 度 特 


过 暗 通道 先 验算 法 估计 雾 天 


多 


征 和 视觉 特征 进行 等 级 识别 。 具 体 地 ， 首 先 传输 矩阵 通路 通 


像 的 传输 矩阵 、 场 景深 度 通路 


通过 深度 估计 子 网 络 估计 筋 天 图 像 深度 图 、 视 觉 特征 通路 通 
过 残 差 子 网 络 提取 图 像 的 深度 视觉 特征 ， 然 后 设计 了 注意 力 
融合 模块 自 适应 地 融合 这 三 个 通路 的 特征 ， 最 后 通过 全 连接 
层 对 融合 的 特征 进行 最 终 的 能 见 度 等 级 分 类 。 为 了 训练 和 评 


估 所 提出 的 网 络 ， 本 文 构建 了 两 个 数据 集 ， 一 个 是 合成 数据 


粒子 衰减 最 终 到 达成 像 设 备 的 光 强 ， 男 一 部 分 主要 是 由 大 气 
介质 中 的 太阳 光 散 射 形 成 的 大 气 光 强 。 其 模型 的 具体 形式 可 
以 表示 : 


I(x) =J) +AA -ta (1) 
其 中 ，x 为 图 像 中 像素 的 空间 坐标 ， 160 为 拍摄 到 的 雾 天 图 
f&. JO 为 对 应 的 无 雾 图 像 。 AGO 为 大 气 环境 中 的 光 强 ， 通 
常 将 它 假设 为 一 个 常数 变量 。 (00 为 传输 矩阵 ， 其 物理 含义 
是 由 目标 物体 反射 的 光 经 大 气 粒子 散射 后 能 够 达到 成 像 设备 
的 能 力 。 对 于 RGB 图 像 , 一 般 认为 三 色 通 道具 有 相同 的 传输 
矩阵。 当 假 设 大 气 光 均 名 时 ，i(%) 可 以 表示 如 下 : 

f(x) = eP (2) 
其 中 ， 8 为 大 气 衰减 系数 ， d 为 像素 x 的 场景 深度 。 

1.2 基于 物理 模型 的 图 像 能 见 度 识 别 方法 

许多 传统 的 图 像 能 见 度 识别 方法 由 主要 是 基于 传统 图 
像 处 理 或 大 气 散射 模型 。 文 献 [11] 依 据 Koschmieder 定律 指 
出 ， 光 会 受 漂浮 在 空中 的 水 粒子 影响 而 发 生 扩散 。 基 于 这 一 
现象 ，Hautiere 等 人 发 现 地 平 线 上 的 灰 度 变化 可 以 用 来 测 和 

图 像 中 的 雾 浓 度 ， 进 而 估计 能 见 度 距离 。 在 文献 [12] 中 ， 

R.Gallen 等 人 基于 判别 外 部 光源 周围 是 否 存在 后 向 散射 的 光 
晕 来 检测 是 否 有 和 雾 , 并 由 此 估计 气象 能 见 度 距离 。 在 文献 [13] 
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H, S.Bronte 等 人 进一步 指出 ， 由 于 水 颗粒 和 其 他 散射 介质 
漂浮 在 空气 中 ， 来 自 天 空 的 光 会 扩散 并 聚焦 在 道路 区 域 ， 道 
路 与 天 空 之 间 的 边界 会 变 得 模糊 ， 因 此 可 以 通过 计算 相对 天 
空 高 度 得 到 能 见 度 距离 。 在 文献 [14] 中 , JL. Mao 等 人 依据 大 气 
散射 模型 构造 了 一 个 可 调 的 经 验 函数 来 识别 雾 才 程 度 ， 并 对 
多 种 户外 图 像 进行 了 统计 分 析 ， 通 过 多 元 线性 回归 估计 了 经 


验 函数 中 的 超 参数 。 然 而 ， 这 种 启发 式 设计 的 经 验 函 数 并 不 
能 很 好 地 推广 到 实际 的 高 速 公路 场景 中 ， 影 响 了 识别 性 能 。 
1.8. 基于 深度 学 习 的 图 像 能 见 度 识别 方法 

近年 来 ， 卷 积 神经 网 络 在 图 像 识别 0529、 目 标 检 测 中 ”区 
等 计算 机 视觉 任务 中 都 取得 了 巨大 的 成 功 ， 并 被 应 用 于 图 像 


攻 ， 另 一 个 是 真实 的 高 速 公路 场景 数据 集 。 合 成 数据 集 使 / 


FRIDAI 和 FRIDA2 中 的 无 雾 图 像 及 其 深度 图 来 生成 不 同 强 
度 的 有 雾 图 像 ， 真 实 场景 数据 集 是 从 我 国 的 多 个 高 速 公路 监 
控 系 统 中 收集 到 的 图 像 ， 这 些 监控 图 像 的 能 见 度 等 级 是 由 专 
业 气 象 人 员 进 行 标 定 。 在 这 两 个 数据 集 上 的 实验 表明 ， 本 文 


提出 的 方法 比 现 有 方法 更 能 准确 地 识别 高 速 公路 能 见 度 。 本 


文 的 主要 贡献 如 下 : 


ID) 提出 了 一 种 新 的 网 络 模型 ， 仅 从 单 张 雾 天 监控 图 像 识 
别 高 速 公 路 能 见 度 等 级 。 该 方法 可 为 高 速 公 路 交管 部 门 提供 
低 成 本 且 高 效 的 智能 管控 技术 支持 。 


2) 本 文 根 据 大 气 散射 模型 提出 了 由 深度 视觉 特征 通路 、 


传输 矩阵 通路 和 场景 深度 通 


路 组 成 的 多 通路 网 络 ， 并 通过 注 


意 力 融合 模块 对 三 个 通路 进行 


等 级 ， 有 效 提 升 了 识别 精度 


o 


自 适 应 融合 ， 进 而 识别 能 见 度 


3) 本 文 构建 了 一 个 合成 数据 集 和 一 个 真实 场景 的 高 速 公 


路 数据 集 进行 性 能 评估 ， 在 这 两 个 数据 集 上 的 实验 结果 验证 


了 该 网 络 的 优越 性 能 。 
1 ”相关 工作 


在 本 节 中 ， 首 先 阐述 了 雾 天 成 像 的 大 气 散 射 模型 ， 然 后 


对 现 有 基于 图 像 的 能 见 度 识别 工作 进行 了 综述 。 这 些 现 有 工 


作 大 致 可 以 分 为 两 类 ， 一 类 是 


是 基于 深度 学 习 的 方法 。 
1.1 大 气 散射 模型 


基于 物理 模型 的 方法 ， 另 一 种 


1999 年 ，Srinivasa G. Narasimhan 等 人 提出 了 大 气 散 射 


模型 ， 定 量 建 模 筋 天 成 像 过 程 趾 。 此 模型 假设 成 像 设 备 所 接 


收 到 的 光 强 来 自 两 个 部 分 : 


部 分 是 由 物体 反射 ， 经 由 大 气 


去 雾 任务 。 然 而 ， 图 像 能 见 度 识 别 与 图 像 去 雾 是 两 个 不 同 的 
任务 ， 目 前 只 有 少数 工作 尝试 使 用 卷 积 神经 网 络 来 识别 能 见 
度 水 平 ,ZhangJ 等 人 提出 了 一 种 可 用 于 检测 室外 图 像 雾 者 浓 
度 的 端 到 端 卷 积 神经 网 络 。 有 具体 而 言 ， 该 方法 使 用 了 雾 才 图 
像 和 相同 场景 下 的 无 雾 图 像 共同 引导 网 络 训 练 ， 将 两 张 图 像 
中 的 结构 相似 性 (SSIM) 分 数 作为 回归 目标 外 。 然 而 ， 在 实际 
应 用 中 较 难 收集 无 雾 和 相应 有 雾 的 图 像 对 。Gunawan 等 人 使 
用 经 典 的 Alexnet 从 有 雾 图 像 中 检测 能 见 度 信息 09]。LiY 等 
人 提出 了 一 种 估计 和 监测 城市 空气 污染 的 方法 ， 该 方法 利用 
暗 通道 先 验 B 估 计 传 输 和 矩阵 ， 利 用 深度 卷 积 神经 网 络 29 估 计 
深度 图 ， 并 设计 预定 义 的 转换 和 池 化 函数 的 组 合 来 识别 雾 才 
水 平 2。 但 是 ， 预 定义 的 变换 函数 限制 了 深度 网 络 的 表示 能 
力 ， 不 利于 提高 识别 精度 。 总 结 来 说 ， 从 单 张 雾 天 图 像 识 别 
能 见 度 水 平 是 一 个 具有 挑战 性 的 问题 ， 如 何 更 好 地 融合 多 种 
类 型 的 特征 是 应 对 这 一 挑战 的 关键 。 


2 ， 多 通路 融合 识别 网 络 


大 气 散 射 模型 可 知 ， 传 输 和 矩阵 与 场景 深度 信息 是 估计 
雾 浓度 的 两 个 重要 参数 。 同 时 ， 学 习 视 觉 特征 也 有 利于 分 析 
雾 的 分 布 。 为 此 ， 本 文 提 出 了 大 气 散 射 模型 启发 的 多 通路 深 
度 融 合 识别 网 络 。 该 网 络 采 用 三 条 通路 联合 学 习 输入 图 像 的 
传输 矩阵 、 场 景深 度 和 视觉 特征 ， 并 通过 注意 力 模块 自 适 应 
融合 三 条 通路 特征 进行 高 速 公 路 雾 天 图 像 能 见 度 等 级 识别 。 
在 本 节 中 ， 将 首先 介绍 所 提出 方法 的 总 体 结构 ， 然 后 阐述 注 
意 力 融合 模块 设计 ， 最 后 介绍 网 络 参 数 的 学 习 方 法 。 
2.1 网 络 架 构 

该 网 络 的 总 体 架 构 如 图 2 所 示 。 首 先 对 输入 的 雾 天 场景 


T 
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图 像 进 行 三 通路 


模块 中 进行 自 适 
从 而 识别 出 能 见 


2.1.1 场景 深度 通路 


和 矩阵 和 深度 视觉 特征 。 
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并 行 处 理 ， 分 别 得 到 估计 
然后 将 三 部 分 特征 输入 到 注意 力 融 合 
应 融合 ， 由 全 连接 层 对 融合 特征 进行 分 类 ， 


度 等 级 。 FH 


残 差 块 为 三 层 结构 。 第 
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的 场景 深度 、 传 输 图像 中 学 习 深度 视觉 特征 。 和 残 差 模块 由 于 其 优越 的 学 习 能 力 09 
被 广泛 应 用 于 计算 机 视觉 任务 中 。 与 文献 [16] 类 似 , 所 使 ) 
层 和 第 三 层 都 使 用 1x1 卷 积 , 分 别 用 
E 缩 特征 、 扩 大 特征 映射 的 通道 维 数 。 通 过 这 种 瓶颈 设计 ， 


的 


屋 卷 积 层 只 需要 处 


o paan 


里 低 通 道 维度 的 特征 。 对 于 雾 天 能 见 


该 通路 用 于 提取 输入 图 像 的 场景 深度 特征 。 场 景深 度 特 ，” 度 识别 任务 ， 还 需要 提取 多 尺度 特征 来 更 好 地 学 习 雾 分 布 。 
征 反映 了 场景 中 的 物体 与 监控 摄像 机 之 间 的 距离 ， 这 是 估计 寻 此 ,本 网 络 将 残 差 块 的 第 三 层 设计 为 三 个 并 行 的 空洞 卷 积 ， 
能 见 度 水 平 的 一 个 重要 依据 。 本 文选 用 FastDepth 网 络 P2 对 其 空洞 率 分 别 为 1、3 和 5， 从 而 能 够 提供 不 同感 受 野 范围 内 
输入 图 像 进 行 景深 估计 。FastDepth 网 络 采 用 编码 器 -解码 器 ”的 多 尺度 特征 。 为 了 减低 特征 图 的 空间 分 辨 率 ， 首 先 在 三 个 
结构 进行 单 目 深度 估计 ， 其 显著 优点 是 结构 简单 、 模 型 轻 量 ” 残 差 结构 之 前 进行 了 步 幅 为 2 的 3x3 卷 积 和 最 大 池 化 操作 。 
化 ， 同 时 可 以 保持 较 高 的 精度 。 为 了 降低 计算 复杂 度 ， 网 络 编 司 时 ， 将 其 中 两 个 残 差 块 中 的 卷 积 步 幅 设置 为 2。 该 通路 共 
码 器 采用 MobileNet 模型 ， 将 编码 器 中 的 标准 卷 积 层 分 解 为 深 ”执行 了 四 次 x2 降 采 样 。 
度 卷 积 和 逐 点 卷 积 。 解 码 器 执行 $ 次 上 采样 ， 中 间 三 次 上 采样 22 注意 力 融合 模块 
的 结果 通过 Skip Connections 的 方法 分 别 与 编码 器 部 分 的 特征 本 文 设计 了 一 个 基于 注意 力 机 制 的 自 适 应 融合 模块 ， 对 
进行 了 特征 融合 ， 为 了 减 小 上 采样 部 分 的 通道 特征 ， 还 使 用 了 三 个 通路 输出 的 场景 深度 4(x) 、 传 输 矩 阵 100 和 深度 视觉 特 


5x5 的 卷 积 来 降 维 。 最 后 使 用 
2.1.2 传输 矩阵 通路 
此 通路 用 于 估计 输入 雾 天 图 像 的 传输 矩阵 。 根 据 式 (2)， 


物理 因素 ， 


1x1 的 卷 积 得 到 高 分 辩 率 深度 图 。 征 F 进行 有 效 融 合 。 多 通路 注意 力 融 合 模 块 的 整体 结构 如 图 
3 所 示 。 考 虑 到 场景 深度 和 传输 矩阵 是 与 雾 浓度 相关 的 重要 
因此 首先 通过 concatenate 操作 将 46) 与 t) 进行 


pu 


传输 矩阵 是 大 气 消 光 系 数 与 场景 深度 乘积 的 负 指 数 函 数 。 通 融合 ， 并 通过 卷 积 模块 进一步 提取 高 层 特征 。 该 卷 积 模块 
过 估计 传输 矩阵 ， 可 以 来 推断 雾气 浓度 。 根 据 暗 通道 先 验 模 两 个 3x3 卷 积 层 、 两 个 最 大 池 化 层 组 成 , 步 幅 为 2, 保证 卷 积 
型 中 ， 使 用 下 面 公式 估计 传输 矩阵 ;: 模块 的 输出 和 深度 视觉 特征 F 具有 相同 的 空间 分 辨 率 。 将 卷 
pe G) 积 模块 处 理 后 的 特征 与 深度 视觉 特征 F 通过 concatenate 操 
meme e 作 进行 融合 ， 同 时 使 用 1xl 卷 积 来 减少 融合 后 的 特征 通道 数 ， 
其 中 ， “为 颜色 通道 ，o(0<w<D 是 一 个 常数 参数 ，9GCD 是 一 将 其 记 为 f; o 
个 以 x 为 中 心 的 图 像 块 ，J*(%) 是 通道 < 在 x 位 置 的 像素 值 ， 特征 中 每 个 通道 和 空间 位 置 对 能 见 度 水 平 识 别 具 有 
4 是 估计 的 天 空 亮度 。 在 本 文 实验 中 ，% 设 为 0.95， 图 像 块 不 同 贡 献 度 。 因 此 ， 本 文通 过 注意 力 机 制 自 适应 地 关注 
的 数量 设置 为 S。 并 进一步 使 用 导向 滤波 对 估计 的 传输 矩阵 空间 和 通道 维度 上 的 重要 特征 。 注 意 力 融合 模块 配置 为 
;进行 细 化 。 残 差 空间 注意 和 残 差 通 道 注 意 的 级 联结 构 ， 残 差 注 意 力 


2.1.3 深度 视觉 特征 通路 


该 通路 是 由 


多 个 残 差 块 组 成 的 卷 积 网 络 ， 用 于 从 输入 的 
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图 2 ”大 气 散射 模型 启发 的 筋 天 高 速 公 路 能 见 度 识别 网 络 
Fig.2 Highway visibility recognition network in foggy weather inspired by atmospheric scattering model 
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图 3 注意 力 融合 模块 结构 图 


Fig.3 The detailed architecture of attention fusion module 


的 优点 是 能 够 捕获 信息 特征 ， 同 时 减少 信息 损失 和 学 习 
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空间 注意 力 通过 分 配 不 同 的 权重 来 突出 对 能 见 度 识别 任 
务 重要 的 空间 位 置 。 残 差 空间 注意 力 的 详细 计算 可 以 表示 为 
S, = o(ConvWM&(ConvX F,))) (4) 
F; =(1+ S,) 8 Conv3(F;) (5) 
其 中 Conv3 为 3x3 卷 积 操作 ，Convl 73 1x1 卷 积 操作 , 5 为 ReLU 
激活 函数 ，o 为 sigmoid 激活 函数 ，@ 为 元 素 乘 法 。 首 先 通 
过 卷 积 操作 得 到 维度 大 小 为 1xHxw 的 空间 权重 s。， 然 后 依 
据 式 (5) 计 算得 到 空间 注意 加 权 特 征 产 。 

类 似 地 ， 通 道 注 意 力 主要 通过 分 配 不 同 的 权重 来 突出 重 
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高 速 公路 数据 集 : 本 文 收集 了 1200 张 真实 的 高 速 公 路 
监控 图 像 ， 这 些 图 像 是 2019 年 至 2020 年 间 由 中 国 多 条 高 速 
公路 上 的 大 量 监控 摄像 头 拍摄 得 到 的 。 根 据 交通 管理 部 门 的 
应 用 要 求 ， 专 业 的 气象 学 家 根据 能 见 度 距离 将 能 见 度 分 为 四 
个 级 别 。 表 1 给 出 了 详细 的 能 见 度 级 别 标准 ， 等 级 越 高 ， 图 
像 就 越 清晰 ， 能 见 度 距离 就 越 长 。 该 高 速 公 路 数据 集 的 真实 
能 见 度 级 别 由 专业 气象 学 家 和 交通 管理 人 员 共 同 确定 ， 图 5 
显示 了 来 自 这 四 个 能 见 度 级 别 的 部 分 样本 图 像 ， 每 行为 同一 
级 别 。 这 些 高 速 公路 监控 图 像 的 成 像 条 件 差异 很 大 ， 例 如 相 


要 的 特征 通道 。 首先 , 对 空间 注意 力 模 块 得 到 的 进行 全 局 
平均 池 化 操作 8, ， 具 体 为 


1 区 ni 
f= Ey LFG) (6) 


其 中 FRG.DJF$dEDLELG.D 上 的 第 C 通 道 的 值 。H, 操作 将 
特征 维度 从 CxHxW 转换 为 Cxlx1， 然 后 利用 所 得 到 的 特征 
F 来 估计 通道 注意 权重 C, 并 相应 地 计算 出 通道 注意 加 权 特 


征 Fr 。 上 有 具体 地 计算 公式 可 以 表示 为 
C, = o(Convl(o(Convl(ConvX f.)))) (7) 
F$€ 2(1- C,) 8 Conv3(F; ) (8) 


本 文 将 上 述 Conv3 操 作 的 步 幅 设置 为 2, 以 减 小 特征 图 的 
空间 维度 大 小 。FS 是 残 差 注意 力 处 理 后 的 最 终 融 合 特 征 , 将 
其 输入 到 到 全 连接 层 中 进行 最 终 能 见 度 等 级 分 类 。 
2.3 损失 函数 

该 网 络 包 含 多 个 需要 优化 的 参数 块 ， 即 场景 深度 通路 、 
视觉 特征 通路 、 多 通路 注意 力 融合 模块 和 全 连接 层 。 为 了 减 
少 学 习 难 度 , 本 文采 用 两 阶段 化 的 学 习 方法 来 更 新 网 络 参数 。 
在 第 一 阶段 , 只 学 习 场 景深 度 通路 的 参数 Od 。 在 第 二 阶段 ， 
固定 了 场景 深度 通路 的 参数 @d ， 重 点 学 习 剩 余 的 部 分 , 包括 深 


对 于 第 二 学 习 阶段 ， 损 失 函 数 采 用 交叉 函 数 ， 有 具体 定义 为 
LO) =-$ y, log F (9.30) (9) 


其 中 6={Bv,Ba,8f} 为 网 络 中 需要 更 新 的 参数 ，% 为 第 i 个 训 
练 样本 ， FO) 为 网 络 整 体 的 相关 函数 映射 ，f(@,*). RR x 
分 类 为 第 c 类 的 概率 。 v 表示 二 进 制 变量 ， 如 果 关 的 类 别 与 
其 真 类 别 相同 ， 则 为 1， 和 否则 为 0。C 是 能 见 度 级 别 的 数量 。 
完成 网 络 训练 后 ,网络 可 用 来 识别 新 测试 样本 的 能 见 度 等 级 。 


3 ”实验 部 分 


3.1 数据 集 介绍 
在 本 工作 中 ， 构 建 了 两 个 数据 集 进行 网 络 训练 与 实验 评 
估 ， 包 括 合 成 数据 和 真实 场景 数据 集 。 

FRIDA 数据 集 : FRIDA 数据 集 由 FRIDA1 数据 集 和 
FRIDA2 数据 集 构建 。FIDA1 和 FRIDA2 最 初 是 为 图 像 去 雾 
任务 而 设计 的 ，FRIDA1 包含 18 个 城市 道路 场景 的 90 张 合 
X ERU, FRIDA2 包含 66 个 不 同 的 道路 场景 的 330 张 合成 
图 像 20， 每 个 合成 场景 都 配 有 一 张 清 晰 图 像 和 一 张 相 应 的 场 
景深 度 图 。 根 据 式 (2)， 本 文 使 用 清晰 的 图 像 和 相应 的 场景 深 
度 图 ， 通 过 改变 P 的 值 来 生成 多 张 有 和 雾 图像 ， 以 模拟 不 同 能 
见 度 等 级 下 的 图 像 。 图 4 显示 了 用 不 同 的 8 值 生成 的 一 些 样 


机 高 度 和 观看 方向 、 天 气 条 件 和 照明 强度 可 能 都 不 同 。 
表 1 能 见 度 等 级 标准 
Tab. 1 Visibility level standard 


度 视觉 特征 流 的 参数 @v 、 注 意 融 合 模块 的 Ba 和 全 连接 层 的 Of 。 


visibility level 0 1 2 3 
visibility distance 0-100m  100-200m 200-500m 500m+ 
level 0 
0-100m 


level 1 
100-200m 
level 2 
200-500m 
P 9 1 level 3 
9 500+m 


图 5 来 自 四 个 级 别 的 部 分 图 像 
Fig.5 Some sample images from four visibility levels 
3.2 ”实验 设置 
在 实验 中 所 提出 的 网 络 将 分 两 阶段 进行 训练 。 首 先 使 用 
NYU Depth V2 数据 集 2 对 场景 深度 通路 进行 预 训练 。 然 后 
固定 场景 深度 通路 的 参数 , 更 新 其 余 参数 ,其 中 传输 矩阵 通路 
没有 可 学 习 的 参数 。 本 文 使 用 PyTorch 框架 搭建 网 络 ， 使 用 
GPU2080Ti 训练 网 络 ， 采 用 ADAM 方法 29 作 为 优化 器 来 更 
新 网 络 参 数 。 优 化 器 中 参数 的 详细 设置 包括 : A-09 和 
B, -0.9999 。 学 习 速 率 初始 化 为 1xl0*, 在 每 30 个 周期 后 下 降 
到 一 半 ，batch-size 的 大 小 设置 为 16。 
3.8 对比 实验 
在 本 文中 ， 将 所 提出 的 方法 与 现 有 的 基于 深度 学 习 的 能 
见 度 识别 方法 在 FRIDA 数据 集 和 高 速 公路 数据 集 上 进行 了 
对 比 实验 。 选 取 的 对 比方 法 包括 AlexNet?"!. depth @ 
trans[?*!1( 深 度 信 息 + 暗 通道 先 验 ) 和 MSBDNP8。AlexNet 方法 
是 仅 通过 AlexNet 提取 可 视 化 特征 ,用 于 能 见 度 等 级 识别 091。 
depth @ trans 最 初 是 为 估计 雾 狗 水平 而 设计 的 回归 模型 0， 
为 了 使 该 模型 适应 离散 的 能 见 度 等 级 分 类 任务 ， 将 其 输出 层 
修改 为 全 连接 层 ， 而 上 骨干 网 络 保持 不 变 ， 肯 干 网 络 中 深度 图 
和 传输 矩阵 的 变换 函数 选取 为 单位 变换 T(x)=x， 并 将 这 两 个 
特征 连接 起 来 进行 分 类 。 此 外 本 文 还 修改 了 一 种 基于 深度 学 
习 的 图 像 去 雾 算法 ， 通 过 保留 主干 网 络 和 添加 全 连接 层 来 识 
别 能 见 度 级 别 。 在 实验 中 ， 选 择 了 一 个 最 新 的 、 高 效 的 图 像 
去 雾 网 络 MSBDNP?I, 使 用 其 编码 器 从 和 雾 天 图 像 中 提取 特征 ， 
然后 利用 提取 的 特征 对 能 见 度 级 别 进行 识别 。 对 比 实验 结果 


本 ，Z 值 越 大 ， 雾 浓度 越 大 。 总 共生 成 了 756 张 雾 图 像 ， 
根据 能 见 度 将 图 像 分 为 四 个 级 别 : 2699. 5659. "HERE. 


itn 


图 4 通过 改变 B 值 生成 的 一 些 样本 图 片 
Fig.4 Some images generated by changing the value of £ 


如 表 2 所 示 ， 被 加 粗 的 为 最 好 精度 。 
据 表 2 的 实验 结果 ，depth 8 trans 方法 在 两 个 数据 集 上 
的 性 能 都 较 差 。 主 要 原因 是 此 方法 只 结合 估计 的 场景 深度 和 
传输 矩阵 来 识别 能 见 度 级 别 ， 这 对 传输 矩阵 和 场景 深度 的 估 
计 精 度 有 很 高 的 要 求 。 然 而 ， 在 真实 的 场景 中 ， 很 难 准确 地 
估计 这 些 参数 ,MSBDN 的 性 能 优 于 AlexNet, 这 表明 MSBDN 
的 编码 器 网 络 相 比 于 AlexNet 可 以 学 习 到 更 多 的 信息 性 视觉 
特征 。 本 文 所 提出 的 MSVP-Net 在 两 个 数据 集 上 都 具有 最 好 
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的 识别 精度 ， 特 别 地 ， 该 方法 在 真实 场景 高 速 公路 数据 集 上 
有 较 大 的 性 能 优势 。 图 6 展示 了 这 些 方 法 在 高 速 公路 数据 
集 上 的 识别 结果 的 混淆 矩阵 ， 可 以 看 出 本 文 提 出 的 方法 更 具 
有 分 类 稳定 性 。 图 7 展示 了 四 组 在 高 速 公 路 数据 集 上 的 四 种 
方法 的 识别 结果 和 真实 结果 的 对 比 样本 ， 尽 管 每 个 场景 的 监 
测 角度 和 光照 条 件 存在 差异 ， 但 本 文 方法 可 以 对 这 四 个 样本 
场景 都 作出 正确 的 识别 。 图 8 展示 了 本 文 方法 在 合成 数据 集 
和 高 速 公 路 数据 上 的 部 分 识别 结果 ， 可 以 得 知 该 方法 在 大 部 
分 情况 下 都 可 以 作出 准确 的 识别 。 图 中 1~4 行 对 应 高 速 公路 
数据 集 ， 第 5 行 对 应 合成 数据 集 。 
表 2 四 种 方法 在 FRIDA 数据 集 和 高 速 公 路 数据 集 上 的 识别 精度 
Tab.2 The recognition accuracy of multiple methods 
upon FRIDA and Highway datasets 


dataset ^ AlexNetU?! depth @ trans?"  MSBDN'U* MSVP-Net 
FRIDA 98.5995 93.84% 98.59% 99.15% 
Highway 71.06% 70.21% 77.45% 84.68% 
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(c) MSBDN (d)MSVP-Net 
图 6 ”四 种 方法 在 高 速 公 路 上 的 识别 精度 混淆 矩阵 
Fig.6 The confusion matrix of multiple methods on the highway dataset 
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图 7 四 种 方法 在 高 速 公路 数据 上 识别 结果 与 真实 结果 对 比 的 可 视 化 


Fig.7 Visualization ofthe comparison of the four methods between 


the recognition results and the real results on the highway data 
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图 8 本 文 方法 在 高 速 公路 数据 集 与 合成 数据 集 上 
识别 结果 与 真实 结果 对 比 的 可 视 化 


Fig.8 Visualization of the comparison of the methods of this paper 


between the recognition results and the real results on the highway 
dataset and synthetic dataset 
本 文 方法 的 优越 性 主要 来 自 于 两 个 方面 ， 一 方面 是 所 提 
出 的 多 通路 体系 结构 能 够 有 效 地 集成 视觉 特征 、 传 输 矩 阵 和 
场景 深度 信息 ， 以 进行 能 见 度 识别 。 另 一 方面 ， 设 计 的 多 通 
路 注意 力 融 合 模 块 可 以 自 适应 地 选择 对 能 见 度 识别 重要 的 特 
征 。 而 在 下 一 节 中 ， 将 通过 消融 实验 来 进一步 评估 这 两 个 方 
面 的 有 效 性 。 
3.4 消融 实验 
该 网 络 具 有 多 通路 体系 结构 和 自 适 应 注意 力 融合 的 特点 ， 
在 本 节 中 ， 进 一 步 进行 了 消融 研究 ， 以 验证 它们 是 否 能 够 提 
高 识别 性 能 。 首 先 为 验证 深度 视觉 通路 中 空洞 卷 积 模 入 的 有 
效 性 ， 构 建 了 两 种 深度 视觉 通路 结构 : 引入 空洞 卷 积 的 残 差 
网 (deep visual feature-1) 与 普通 残 差 网 络 (deep visual 
feature-2)。 并 将 两 种 结构 的 深度 视觉 特征 通路 与 场景 深度 通 
路 、 传 输 和 矩阵 通路 、 普 通 连接 操作 和 多 通路 注意 力 融合 作为 
设置 选项 ， 结 合 这 些 设 置 选项 形成 了 五 种 简化 网 络 模型 ( 消 
融 )。 表 3 显示 了 五 种 消融 方法 和 所 提 方 法 的 识别 精度 。 消 融 
方法 1~4 使 用 的 深度 视觉 通路 均 为 嵌入 空洞 卷 积 的 结构 。 消 
融 方法 1 使 用 普通 的 连接 操作 来 融合 这 三 个 流 , 消融 方法 2、 
3 和 4 只 使 用 其 中 某 两 个 通路 进行 识别 。 通 过 比较 所 提 昌 
的 MSVP-Net 与 消融 方法 2-4， 可 以 发 现 三 种 通路 的 组 合 
有 最 高 的 识别 精度 ， 通 过 比较 所 提出 的 MSVP-Net 与 消 
融 方法 1， 可 以 看 出 ， 自 适应 注意 力 融合 也 可 以 显著 提高 
识别 精度 。 消 融 方法 5 使 用 的 深度 视觉 通路 为 普通 残 差 网 
络 ， 其 余 设置 与 所 提出 的 方法 MSVP-Net 相同 ， 通 过 比较 
消融 方法 5 与 所 提 方 法 MSVP-Net 可 以 看 出 ， 由 于 雾 的 分 
布 具 有 空间 不 均匀 性 ， 空 洞 卷 积 通过 扩大 感受 野 ， 提 取 多 
尺度 特征 能 够 更 有 利于 学 习 雾 的 分 布 ， 助 于 能 见 度 的 识别 。 
综 上 ， 这 些 消 融 结 果 充 分 证 明了 深度 视觉 通路 结构 、 多 通 
路 组 合 与 自 适 应 融合 的 有 效 性 
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A3 本文 方法 与 五 种 消融 方法 的 识别 精度 


Tab.3 The prediction accuracy of the proposed method and five ablation methods 


Setting MSVP-Net ablation method 1 ablation method 2 ablation method 3 ablation method 4 ablation method 5 
Deep Visual Feature-1 Y Y Y Y Y x 
Deep Visual Feature-2 x x x x x N 
Scene Depth Y Y Y x x Y 
Transmission Matrix Y Y x y x Ni 
Concatenation Fusion x Y x x x x 
Attention Fusion Y x Y Y Y Y 
Accuracy 84.68% 81.70% 82.55% 78.30% 77.02% 83.83% 
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除 此 之 外 , 本文 给 出 了 一 些 中 间 处 理 结果 的 可 视 化 展示 。 
图 9 展示 了 由 场景 深度 通路 和 传输 矩阵 通路 估计 的 高 速 公 路 
监控 图 像 的 深度 特征 图 和 传输 矩阵 特征 图 。 场 景深 度 图 中 颜 
色 较 深 的 颜色 ， 表 示 更 大 的 场景 深度 。 传 输 矩 阵 信息 反 映 了 
在 特定 的 空间 位 置 上 的 传输 速率 ,传输 矩阵 图 中 较 亮 的 颜色 ， 
表示 传播 率 较 高 。 由 于 雾 的 影响 ， 可 以 看 到 高 速 公路 的 场景 
深度 逐渐 缩小 ， 同 时 传输 速率 也 降低 了 ， 这 在 公路 的 远 端 万 
为 明显 。 这 些 结果 也 说 明了 利用 场景 深度 和 传输 矩阵 进行 能 
见 度 等 级 识别 的 合理 性 。 


(a) 高 速 公 路 监控 图 像 ” (b) 估 计 的 景深 图 (ec) 估 计 的 传输 矩阵 图 
图 9 三 幅 高 速 公 路 监控 视频 图 像 及 其 估计 的 景深 图 、 传 输 矩 阵 


Fig.9 Three highway surveillance images and their estimated scene 


DS 


depth and transmission matrix 

图 10 可 视 化 展示 了 多 通路 注意 力 融合 模块 学 习 到 的 注 
意 力 图 ， 第 一 行 是 原 高 速 公 路 监控 图 像 ， 第 二 行为 学 习 到 的 
注意 力图 并 将 其 爱 加 于 原始 图 像 ， 其 中 黄色 显示 区 域 代表 具 
有 高 权重 的 突出 注意 区 域 。 从 图 10 中 看 到 , 本 文 网 络 对 于 能 
见 度 识别 的 突出 区 域 主要 位 于 公路 上 ， 并 沿 着 公路 的 延伸 方 
向 分 布 。 对 于 能 见 度 较 低 的 场景 ， 最 突出 的 区 域 主要 位 于 刚 
刚 看 不 见 消 失 在 筋 中 的 路 段 ， 对 于 能 见 度 高 的 场景 ， 在 地 平 
线 上 也 会 有 突出 的 区 域 。 从 这 些 显著 区 域 的 分 布 来 看 ， 网 络 
识别 方式 在 某 种 程度 上 与 人 类 观察 能 见 度 的 方式 相似 。 
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图 10 多 通路 注意 力 融合 模块 所 学 习 的 注意 力图 
Fig. 10 The visualization of the spatial attention maps learned 


by the multi-stream attention fusion module 
4 ”结束 语 


本 文 提 出 了 一 种 多 通路 深度 融合 网 络 ， 可 以 利用 雾 天 情 
况 下 拍摄 的 监控 图 像 识 别 高 速 公 路 能 见 度 等 级 。 该 网 络 多 通 
路 体系 结构 的 灵感 来 自 于 大 气 散射 模型 ， 有 具体 而 言 ， 此 网 络 
首先 联合 利用 深度 视觉 特征 通路 、 传 输 矩 阵 通 路 和 场景 
深度 通路 进行 特征 学 习 。 然 后 , 设计 了 一 个 注意 力 融合 模块 ， 
自 适应 地 融合 这 三 条 通路 得 到 的 特征 。 最 后 ， 利 用 融合 后 的 
特征 进行 最 终 的 能 见 度 等 级 识别 。 实 验 结果 表明 ， 该 网 络 在 
合成 数据 集 与 真实 场景 数据 集 上 都 具有 良好 的 识别 性 能 ， 充 
分 验证 了 该 方法 的 有 效 性 和 可 行 性 。 


参考 文献 : 


[1] Hassaballah M, Kenk M A, Muhammad K, et al. Vehicle Detection and 


Tracking in Adverse Weather Using a Deep Learning Framework [J]. 


ChinaXiv 合 作 期 刊 
第 39 卷 第 8 期 


IEEE Trans on Intelligent Transportation Systems, 22 (7): 4230 — 4242, 
2021. 

[2] Hautiére N, Aubert D, Dumont É, et al. Experimental validation of 
dedicated methods to in-vehicle estimation of atmospheric visibility 
distance [J]. IEEE Trans on Instrumentation and Measurement, 2008, 57 
(10): 2218-2225. 

[3] HeK, Sun J, Tang X. Single image haze removal using dark channel prior 
[J]. IEEE Trans on pattern analysis and machine intelligence, 2010, 33 
(12): 2341-2353. 

[4] Li B, Peng X, Wang Z, et al. Aod-net: All-in-one dehazing network [C]// 
Proceedings of the IEEE international conference on computer vision. 
2017: 4770-4778. 

[5] Zhang J, Min X, Zhu Y, et al. HazDesNet: An End-to-End Network for 
Haze Density Prediction [J]. IEEE Trans on Intelligent Transportation 
Systems, 2020, online. 

[6] BHF, Fik. 基于 优化 后 透射 率 和 半 逆 法 的 瞳 通道 图 像 去 雾 方 法 
D]. 计算 机 应 用 研究 , 2019, 36 (11): 3174-3178. (Peng Liting, Li Bo. 
Dark channel prior image dehazing method based on optimization 
transmission and semi-inverse algorithm [J]. Application Research of 
Computers, 2019, 36 (11): 3174-3178.) 

[7] Nayar S K, Narasimhan S G. Vision in bad weather [C]// Proceedings of 
the 7th IEEE International Conference on Computer Vision. IEEE, 1999, 
2: 820-827. 

[8] Hautiére N, Labayrade R, Aubert D. Real-time disparity contrast 
combination for onboard estimation of the visibility distance [J]. IEEE 
Trans on Intelligent Transportation Systems, 2006, 7 (2): 201-212. 

[9] Hautiere N, Tarel J P, Lavenant J, et al. Automatic fog detection and 
estimation of visibility distance through use of an onboard camera [J]. 
Machine vision and applications, 2006, 17 (1): 8-20. 

[10] Hautiére N, Labayrade R, Aubert D. Estimation of the visibility distance 
by stereovision: A generic approach [J]. IEICE Transactions on 
information and systems, 2006, 89 (7): 2084-2091. 

[11] Middleton W E K. Vision through the atmosphere [M]// Geophysik 
II/Geophysics II. Springer, Berlin, Heidelberg, 1957: 254-287. 

[12] Gallen R, Cord A, Hautiére N, et al. Nighttime visibility analysis and 
estimation method in the presence of dense fog [J]. IEEE Trans on 
Intelligent Transportation Systems, 2014, 16 (1): 310-320. 

[13] Bronte S, Bergasa L M, Alcantarilla P F. Fog detection system based on 
computer vision techniques [C]// International IEEE Conference on 
Intelligent Transportation Systems. IEEE, 2009: 1-6. 

[14] Mao J, Phommasak U, Watanabe S, et al. Detecting foggy images and 
estimating the haze degree factor [J]. Journal of Computer Science & 
Systems Biology, 2014, 7 (6): 226-228. 

[15] Simonyan K, Zisserman A. Very deep convolutional networks for large- 
scale image recognition [J]. arXiv preprint arXiv: 1409. 1556, 2014. 

[16] He K, Zhang X, Ren S, et al. Deep residual learning for image 
recognition [C]// Proceedings of the IEEE conference on computer vision 
and pattern recognition. 2016: 770-778. 

[17] Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, 
real-time object detection [C]// Proceedings of the IEEE conference on 
computer vision and pattern recognition. 2016: 779-788. 

[8] 华夏 , zd, Enix, F. 复杂 大 交通 场景 弱小 目标 检测 技术 [I]. 
计算 机 应 用 研究 , 2019, 36 (11): 3486-3492. (Hua Xia, Wang Xinqing， 
Ma Zhaoye, et al. Detection of dim and small targets in complex large 
traffic scenes [J]. Application Research of Computers, 2019, 36 (11): 
3486-3492.) 

[19] Gunawan A A S, Prasetyo H, Werdiningsih I, et al. Inferring the level of 


visibility from hazy images [J]. International Journal of Business 


202204.00069v1 


chinaXiv 


Intelligence and Data Mining, 2020, 16 (2): 177-189. 

[20] Liu F, Shen C, Lin G. Deep convolutional neural fields for depth 
estimation from a single image [C]// Proceedings of the IEEE conference 
on computer vision and pattern recognition. 2015: 5162-5170. 

[21] Li Y, Huang J, Luo J. Using user generated online photos to estimate and 


monitor air pollution in major cities [C]// Proceedings of the 7th 


International Conference on Internet Multimedia Computing and Service. 


2015: 1-5. 

[22] Wofk D, Ma F, Yang T J, et al. Fastdepth: Fast monocular depth 
estimation on embedded systems [C]// International Conference on 
Robotics and Automation (ICRA) . IEEE, 2019: 6101-6108. 

[23] Tarel JP Hautiere N, Cord A, et al. Improved visibility of road scene 
images under heterogeneous fog [C]// IEEE Intelligent Vehicles 
Symposium. IEEE, 2010: 478-485. 


ChinaXiv 合 作 期 刊 


; 3 HZH, 3: 基于 多 通路 融合 网 络 的 高 速 公路 雾 天 能 见 度 等 级 识别 


第 39 卷 第 8 期 


[24] Tarel J P, Hautiere N, Caraffa L, et al. Vision enhancement in 
homogeneous and heterogeneous fog [J]. IEEE Intelligent Transportation 
Systems Magazine, 2012, 4 (2): 6-20. 

[25] Silberman N, Hoiem D, Kohli P, et al. Indoor segmentation and support 
inference from rgbd images [C]// European conference on computer 
vision. Springer, Berlin, Heidelberg, 2012: 746-760. 

[26] Kingma D P, Ba J. Adam: A method for stochastic optimization [J]. arXiv 
preprint arXiv: 1412. 6980, 2014. 

[27] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with 
deep convolutional neural networks [J]. Advances in neural information 
processing systems, 2012, 25: 1097-1105. 

[28] Dong H, Pan J, Xiang L, et al. Multi-scale boosted dehazing network 
with dense feature fusion [C]// Proceedings of the IEEE/CVF Conference 
on Computer Vision and Pattern Recognition. 2020: 2157-2167. 


